iT邦幫忙

2025 iThome 鐵人賽

DAY 1
2

簡介

Hi 我是 Andy 一個「宅宅數據工程師」,這是我第一次參加鐵人賽,我想透過此次競賽來學習一些 AWS 的相關服務,順便鍛鍊一下我撰寫文章的能力,此系列我將以自己的興趣為主題,來增加每天撰文章的動力。

https://ithelp.ithome.com.tw/upload/images/20250914/20163443okZ7M29oDE.png

前言

我常常在想,自己喜歡的事物,到底有多少人也同時喜歡?

所以本次我們將透過其他動漫愛好者「已搜集一段時間」的資料集來作為來源資料,搭配使用 AWS 雲端服務來更進一步的將資料做 ELT 後,最後再使用 BI 工具建立「可視化報表」,來讓自己更輕鬆的看出大家對於各部動漫的喜好程度和評價。

本系列規劃

本系列為期三十天,場景是透過 AWS 雲端服務打造一個數據架構,並建立簡易的 Data Pipeline 來處理本次的動漫數據,接著會透過一些維運的服務,來了解各個服務的運作狀況,所以我安排了以下幾個任務章節。

任務章節:

  • 知識之章:學習資料領域知識
  • 雲基礎之章:實際建立 AWS 帳號、IAM、VPC 和資料上傳等相關服務應用
  • 淬鍊之章:使用 Glue PySpark 淬煉資料 + Iceberg 元數據管理
  • 視覺之章:QuickSight 資料可視化、Lake Formation 資料權限治理
  • 維運之章:CloudWatch、CloudTrial、Iac 等維運服務應用
  • 回顧之章:成本評估、系列內容回顧

從「理論」到「實作」再到「維運」,讓我們一同踏上這場動漫數據的煉金之旅!

結論與建議

由於時間的限制,本系列文章不會特別詳細的介紹到各服務、工具的深度底層原理,但會透過實際案例帶大家走一遍簡易的數據工程 Pipeline 設計。

下篇預告

下篇我們將進入「DAY2 知識之章-理解資料本源」,讓我們一起來了解動漫資料集的詳細內容。

參考資料

[1] ETL 與 ELT 之間有什麼區別?


下一篇
DAY2 知識之章-理解資料本源
系列文
動漫宅的 30 天 AWS Lakehouse 修行日誌3
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言